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【 摘要 】 背景 ”使 用 行政 管理 数据 时 ， 确 立 清晰 、 适 当 的 慢性 病 洗 脱 期 时 长 是 正确 确定 反复 就 医 的 慢性 病 患者 
发 病 时 点 、 确 定 新 发 病例 的 基础 。 目 的 ”通过 系统 文献 回顾 ， 综 述 确定 洗 脱 期 时 长 的 方法 ， 以 期 为 我 国 研究 者 后 续 使 
用 行政 管理 数据 识 4 别 慢性 病 新 发 病例 时 确认 洗 脱 期 长 得、 正确 识别 新 发 病例 提供 思路 。 方 法 于 2021 年 10 月， 系统 
检索 PubMed, Web of Science 、EmBase、 中 国 知 网 、 维 普 中 文科 技 期 刊 全 文 数据 库 、 万 方 知 识 服务 平台 ， 获 取 有 关 利 
用 行政 管理 数据 探究 慢性 病 发 病 、 患 病情 况 的 文献 ， 检 索 时 限 均 为 建 库 至 2022-10-01。 由 两 名 研究 者 独立 筛选 文献 
提取 相关 信息 ， 并 采用 定性 研究 报告 评价 标准 (SRQR ) 评价 文献 方法 学 质量 后 ， 使 用 描述 性 分 析 法 总 结 洗 脱 期 时 长 
的 确定 方法 。 结 果 ” 共 纳入 26 篇 文献 ， 纳 入 文献 的 SRQR 评分 均 > 15 分 ， 方法 学 质量 较 好 。 文 献 所 使 用 的 数据 主要 
来 自 加 拿 大 、 美 国 、 澳 大 利 亚 等 行政 管理 数据 完整 、 丰 富 的 国家 ( 地 区 ) ， 聚 焦 的 疾病 包括 糖尿 病 、 肿 瘤 、 精 神 分 裂 
症 等 多 种 慢性 病 。 研 究 指出 ， 设 定 合 适 的 洗 脱 期 时 长 是 准确 识 别 发 病 病 例 的 基础 目前 ,文献 中 确定 洗 脱 期 时 长 的 方 
法 主要 包括 直接 限定 法 、 一 致 性 检验 法 和 逆向 生存 函数 法 三 大 类 ， 其 中 最 常用 的 方法 是 直接 限定 法 ， 逆 向 生存 曲线 法 
的 使 用 率 相 对 较 低 。 结 论 ” 直接 限定 法 、 一 致 性 检验 法 和 逆向 生存 函数 法 均 有 相应 的 优势 和 局 限 性 ， 方 法 的 选择 标准 、 
判断 标准 和 稳定 性 有 竺 进一步 探究 。 
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[Abstract] Background When using administrative data, the establishment of clear and appropriate duration of 
chronic disease washout period is the basis for correctly identifying the point of onset of chronic disease in patients with recurrent 
visits and identifying new cases. Objective To review the methods for determining the duration of washout period by a systematic 
review of literature, in order to provide ideas for Chinese researchers to confirm the duration of washout period and correctly 
identify new cases with subsequent use of administrative data to identify new cases of chronic diseases. Methods In October 
2021, PubMed, Web of Science, EmBase, CNKI, CQVIP and Wanfang Knowledge Service Platform were systematically 
searched for literature on the use of administrative data to explore the incidence and prevalence of chronic diseases from inception 
to 2022-10-01. Two researchers independently screened literatures and extracted relevant information, evaluated the quality of 


literatures by using the Standards for Reporting Qualitative Research ( SRQR ) scale, and summarized the determination method 
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of the duration of washout period. Results A total of 26 papers were included, and the SRQR scores of the included literature 


were all Z 15, indicating good methodological quality. The data used in the literature were mainly from Canada, the United 


States, Australia and other countries ( regions ) with complete and abundant administrative data, and focused on a variety of 


chronic diseases, including diabetes, tumor, schizophrenia and other chronic diseases. The study pointed out that setting an 


appropriate washout period duration is the basis for accurate identification of onset cases. The methods used to determine the 


duration of washout period in literature were mainly divided into three major categories, including direct restriction method, 


consistency test method and retrograde survival function method. Among them, the most commonly used method was direct 


restriction method, while the retrograde survival function method had a relatively low usage rate. Conclusion 


Direct restriction 


method, consistency test method and retrograde survival function method all have corresponding advantages and limitations. The 


selection, judgment criteria and stability of the method need to be further explored. 


[ Key words ] 


为 了 有 效 预防 和 控制 糖尿 病 、 肿 瘤 、 慢 性 阻塞 性 肺 
疾病 等 多 种 慢性 病 ， 需 要 准确 估计 疾病 的 患 病 率 和 发 病 
率 。 目 前 ， 已 有 一 些 研究 者 通过 开展 大 型 队列 、 调 查 研 
究 对 疾病 的 患 病 、 发 病情 况 展开 调查 ， 但 这 种 研究 方式 
具有 耗 时 长 、 耗 资 大 的 特点 。 因 此 ， 可 考虑 应 用 医疗 保 
念 报销 记录 、 健 康 监测 数据 等 行政 管理 数据 对 慢性 病 的 
流行 病 学 特征 进行 分 析 。 与 患者 从 出 生 到 死亡 的 全 生命 
周期 的 医疗 记录 不 同 ， 医 疗 保险 数据 多 为 有 限 年 份 下 
的 记录 ， 且 慢性 病 患者 通常 会 反复 就 医 ， 从 这 些 被 截断 
的 、 高 度 重复 的 记录 中 有 效 识 别 出 新 发 病例 有 一 定 难 
度 。 为 解决 这 一 问题 ， 人 研究 者 一 般 以 回顾 期 ( look-back 
period ), 即 洗 脱 期 ( washout period ) 为 基础 确定 新 发 病例 。 
具体 方法 为 : 知 在 目标 检索 年 限 内 患者 出 现在 某 种 慢性 
病 的 登记 记录 中 ， 即 可 认为 其 为 疑似 新 发 病例 ， 以 目标 
检索 年 限 为 基础 ， 向 前 回顾 ， 在 限定 的 洗 脱 期 内 没有 与 
该 病 相 关 的 记录 即 可 确定 其 为 新 发 病例 。 目 前 ， 对 于 洗 
脱 期 的 长 短 尚 没有 统一 结论 :于 ; 。 洗 脱 期 太 短 会 造成 发 
病 率 被 高 估 ， 太 长 则 会 导致 数据 利用 不 足 " 1; 。 一 些 研 
究 者 认为 不 同 疾病 有 不 同 的 发 展 轨 迹 和 特征 一 “! ， 在 使 
用 不 同类 型 数据 确定 不 同 疾病 新 发 病例 时 ， 均 应 采用 合 
适 的 方法 确定 最 佳 洗 脱 期 时 长 。 本 研究 系统 综述 了 确定 
洗 脱 期 时 长 的 方法 ， 以 期 为 我 国 研 究 者 后 续 使 用 行政 管 
理 数据 识别 慢性 病 新 发 病例 时 确认 洗 脱 期 长 得、 正确 识 
别 新 发 病例 提供 思路 。 

1 资料 与 方法 

1.1 文献 纳入 与 排除 标准 ”文献 纳入 标准 : (1) 所 使 
用 的 数据 为 行政 管理 数据 ， 包 括 医疗 保险 数据 、 疾 病 登 
记 注 册 数 据 、 医 院 登 记 数据 等 ， (2 ) 所 聚焦 的 疾病 为 
慢性 病 ， 同 一 患者 因 同 种 疾病 产生 多 次 记录 ; (3 ) BF 
究 目 的 为 探究 疾病 患 病 、 发 病情 况 ， 聚 焦 疾 病 流 行 病 学 


特征 ; CA) 涉及 洗 脱 期 。 文 献 排 除 标准 : CI) 非 中 、 
英文 文献 ; (2) 所 使 用 的 数据 为 非 官方 数据 ， 如 通过 


队列 研究 、 病 例 对 照 研究 获得 的 调查 数据 等 ; (3 ) dE 
原始 研究 ， 如 评论 、 系 统 综述 等 ;〈4 ) 会 议论 文 或 以 


Chronic disease; Administrative data; Insurance data; Washout period; Incidence; Prevalence 


摘要 形式 发 表 的 研究 成 果 ; (5 ) 无 法 获取 原文 的 文献 ; 
(6) 重复 发 表 的 文献 ; 〈7 ) 所 探讨 的 内 容 与 本 研究 关 
注 的 内 容 不 相关 ， 包括 : 仅 利 用 行政 管理 数据 评估 疾病 
负担 、 开 展 队列 /病例 对 照 研 究 等 。 

1.2 文献 检索 策略 ”于 2021 年 10 月 ， 系 统 检 索 3 个 英 
文 数据 库 (PubMed, Web of Science, EmBase ) 和 3 个 
中 文 数据 库 ( 中 国 知 网 、 维 普 中 文科 技 期 刊 全 文 数据 库 、 
万 方 知 识 服务 平台 ) ， 获 取 有 关 利 用 行政 管理 数据 探 
究 慢 性 病 发 病 、 患 病情 况 的 文献 ， 检 索 时 限 均 为 建 库 至 
2022-10-01。 中 文 检 索 词 包括 : 医疗 保险 数据 、 官 方 
数据 、 行 政 数据 、 医 院 数据 、 患 病 、 发 病 ， 洗 脱 期 、 回 
顾 期 、 窗 口 期 。 英 文 检 索 词 包括 : administrative data, 


insurance data, hospital data, Medicare, prevalence, 


incidence, look-back period, wash-out time, clearance 
time, disease-free time, observation time, 以 PubMed 为 
例 ， 有 具体 检索 策略 如 下 : (incidence [Title/Abstract ] 

OR prevalence [ Title/Abstract ] ) AND (insurance data 
[| Title/Abstract ] OR administrative data | Title/Abstract | 

OR hospital data | Title/Abstract ] OR Medicare | Title/ 
Abstract | ) AND ( look-back period [ Title/Abstract ] OR 
wash-out time [ Title/Abstract ] OR clearance time [ Title/ 
Abstract | OR disease-free time | Title/Abstract | OR 
observation time | Title/Abstract | ) o 

1.3 文献 筛选 与 资料 提取 由 2 名 研究 人 员 独 立 筛选 
文献 、 提 取 资 料 ， 并 交 又 核对 结果 ， 如 有 分 歧 ， 通 过 与 
第 3 名 研究 者 讨论 解决 。 文 献 筛选 时 ， 首 先 阅读 文 题 和 
摘要 ， 在 排除 明显 不 相关 的 文献 后 ， 进 一 步 通读 全 文 根 
据 纳 入 和 排除 标准 确定 纳入 分 析 的 文献 。 提 取 的 资料 包 
括 :( 1 ) 文 献 基本 信息 , 作者 、 发 表 年 份 、 聚焦 疾病 ; (2 ) 
使 用 的 数据 库 的 基本 信息 , 国家 (地 区 ) 、 数 据 库 名 称 、 
数据 库 类 型 、 使 用 数据 的 年 份 跨度 、 涵盖 人 和 群 ( 数 ) (3) 
研究 设计 ， 最 佳 洗 脱 期 时 长 的 判断 方法 及 标准 、 设 定 的 
洗 脱 期 时 长 。 

1.4 纳入 文献 方法 学 质量 评价 


由 2 名 研究 人 员 独 立 
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采用 美国 加 利 福利 亚 大 学 提出 的 定性 研究 报告 评价 标准 
( Standards for Reporting Qualitative Research, SRQR ) E 
对 文献 方法 学 质量 进行 评价 ， 如 有 分 上 收 ， 通 过 与 第 3 名 
研究 者 讨 Y we SRQR 共有 21 个 条 目 ， 研 究 者 对 每 


个 条 目 做 出 “ RE “不 清楚 ”的 判断 ， 选 择 “ 是 ” 
"— 不 清楚 ” 计 0 分 ， 将 各 条 目 得 分 
相 加 即 得 总 分 ， 得 分 范围 为 0~21 分 ， 最 终 纳 入 SRQR 


评分 三 15 分 的 文献 。 
1.5 统计 学 方法 ”使 用 描述 性 分 析 法 总 结 洗 脱 期 时 长 
确定 方法 。 

2 结果 

2.4 文献 筛选 流程 及 结果 ”通过 检索 各 数据 库 获 得 中 
文 文献 21 篇 、 英 文 文献 1 203 o AUi, i, 
获得 基于 行政 管理 数据 评估 慢性 病 患 病 / 发 病情 况 等 流 
行 病 学 特征 的 文献 54 篇 ， 排 除 其 中 未 涉及 洗 脱 期 的 文 
献 28 篇 ， 最 终 纳 入 26 篇 于 * 2 文献。 文献 筛选 流程 
具体 见 图 1。 

2.2 纳入 文献 基本 信息 及 使 用 的 数据 库 的 基本 信息 

纳入 的 26 篇 文献 均 为 英文 文献 ; 所 使 用 的 数据 主要 来 
自 加 拿 大 、 美 国 、 澳 大 利 亚 等 行政 管理 数据 完整 Eu 
的 国家 ( 地 区 ) ; 所 聚焦 的 疾病 包括 糖尿 病 、 肿 瘤 、 精 
神 分 裂 症 等 多 种 慢性 病 ， 其 中 diete 5 mmm 
23 25 3] 文献 聚焦 心血 管 疾病 ，5 篇 "0 23 2 文献 聚 
焦 糖尿 病 ; 研究 目的 主要 为 确定 多 种 慢性 病 的 发 病 、 患 
病情 况 ; 12 篇 [3, 6, 9-11, 13, 16, 19-20, 24, 26-27] 文献 所 使 用 的 
数据 为 医疗 保险 数据 ，8 篇 全 4 S mm 25. neg 
使 用 的 数据 为 医院 患者 注册 登记 数据 ， 其 余 文 献 所 使 用 


的 数据 为 经 注册 的 居民 健康 项 目 数据 ”或 经 注册 的 
疾病 调查 项 目 数据 ”* ” ;所 使 用 的 数据 年 份 跨度 


较 大 ， 其 中 仅 有 两 篇 "5 中文 献 所 使 用 的 数据 年 份 跨度 


<5 年 ， lf t 2, 5, 8, 10-12, 14, 16, 17, 21, 24-26, 28] 文献 所 使 用 
的 数据 年 份 跨度 三 10 年 。 纳 入 文献 基本 信息 及 使 用 的 
数据 库 的 基本 信息 见 表 1。 

23 纳入 文献 的 方法 学 质量 评价 结果 纳入 文献 的 
SRQRQ 评分 均 >= 15 分 〈( 受 限于 篇 幅 ， 本 研究 未 通过 单 


独 列表 呈现 纳入 研究 的 方法 学 质量 评价 具体 结果 ) ， 见 
表 1。 

24 最 佳 洗 脱 期 时 长 确定 方法 ”通过 系统 文献 回顾 ， 
发 现 目 前 确定 洗 脱 期 时 长 的 方法 主要 包括 直接 限定 法 、 
一 致 性 检验 法 和 道 向 生存 函数 法 三 大 类 。 纳 入 的 26 篇 
文献 中 ， 有 15 篇 009 OU 基于 专家 建议 、 临 床 经 
验 、 文 献 回 顾 或 因 受 限 于 数据 ， 直 接 确 定 洗 脱 期 时 长 ; 
10 篇 文献 0e 07 171 使 用 一 致 性 检验 的 相关 指标 ， 
如 Kappa 值 、 阳 性 预测 值 、 过 高 估计 率 等 评估 不 同 洗 脱 
期 时 长 对 发 病 率 估计 的 影响 、 确 定 洗 脱 期 时 长 ; 3 篇 “ 
使 用 逆向 生存 函数 法 确定 最 佳 洗 脱 期 时 长 。 
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2.4.1 一 致 性 检验 法 10 i o 06 T 9S BER 
用 的 一 致 性 检验 相关 指标 包括 Kappa 值 、 阳 性 预测 
值 、 过 高 估计 率 、 阴 性 预测 值 、 灵 敏 度 、 准 确 度 。 所 
有 文献 均 将 基于 数据 实际 所 能 达到 的 最 长 洗 脱 期 期 限 
作为 洗 脱 期 时 长 “ 金 标 准 ”， 通 过 以 上 指标 定量 比较 
不 同 洗 脱 期 时 长 下 的 发 病人 数 ( Incident patient defined 
by different clearance period，IDD ) 与 基于 洗 脱 期 时 长 

“ 金 标 准 ” 确 定 的 发 病人 数 (Incident patient defined by 
golden criterion, IDG) 之 间 的 差异 性 。6 篇 [01 
7 文献 采用 过 高 估计 率 【 过 高 估计 率 = (IDD-IDG ) / 
IDG x 100% ] 作为 一 致 性 评价 指标 ，3 篇 "文献 所 
采用 的 一 致 性 评价 指标 涉及 Kappa ff, 328 ^ "7 x 


献 所 采用 的 一 致 性 评价 指标 涉及 阳性 预测 值 ，1 篇 
文献 所 采用 的 一 致 性 评价 指标 涉及 灵敏 度 、 特 异 度 和 阴 


性 预测 值 。 目 前 ， 


仅 有 研究 者 基于 Kappa 值 提 出 了 一 


致 性 的 判断 标准 。 按 照 BYRT 等 77 提出 的 判断 标准 : 
当 kappa 值 为 -1.00~<0 时 ， 可 认为 “一 致 性 缺乏 ” 


当 kappa 值 为 0~0.20 时 ， 可 认为 “一 致 性 不 佳 ”; 当 
kappa 值 为 >0.20~0.40 时 ， 可 认为 “ 低 一 致 性 ”; 当 
kappa 值 为 >0.40~0.60 时 ， 可 认为 “一 致 性 一 般 ” 
当 kappa 值 为 >0.60~0.80 时 ， 可 认为 “一 致 性 较 好 ” 


通过 检索 中 国 知 网 、 维 普 中 文科 技 期 刊 全 文 数据 库 、 万 方 知识 服务 平 
台 获 得 文献 (n=21 ) 
得 文献 (n=1 203 ) 


; 通过 检索 PubMed, EmBase, Web of Science X 


[es 


AREE RAO (n=640 ) 


阅读 文 题 和 摘要 初 第 (n=640 ) 


排除 文献 (n=128 ) : 非 原始 研究 (n=2 ) 、 聚 焦 的 疾病 非 慢 
性 病 (n=93) 、 非 中 、 英文 文献 (n=5) 、 所 使 用 的 3 
非 官 方 数据 ， 如 通过 队列 研究 、 病 例 对 照 研究 获得 的 调查 数 
据 等 (n=1 ) 、 会议 论文 或 以 摘要 形式 发 表 的 研究 成 果 (n=27 ) 


阅读 全 文 复 第 (n=512 ) 


ER 


排除 文献 (n=458) :所 控 计 的 内 容 与 本 研究 关注 的 


容 不 相关 (n=18) 、 仅 利用 行政 管理 数据 评估 疾病 负 - 


(n=42 ) 、 基 于 行政 人 理 数据 进行 疾病 的 非 流行 病 学 特 
描述 (n=194 ) 、 仅 利用 行政 管理 数据 开展 队列 、 病 例 对 照 
研究 (n=201 ) 、 无 法 获取 原文 的 文献 (n=3 ) 


基于 行政 管理 数据 评估 慢性 病 患 病 /发 病情 
况 等 流行 病 学 特征 的 文献 (n=54 ) 


| | 排除 未 涉及 洗 脱 期 的 文献 (n=28 ) 


pe" 


纳入 定性 分 析 的 文献 ( n=26 ) 


1 文献 租 选 流程 图 


Figure 1 Literature screening flow chart 
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一 表示 未 提 及 。 


( HMDC) , Mortality Data Set 记 数据 
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表 1 纳入 文献 基本 信息 及 使 用 的 数据 库 的 基本 信息 
Table 1 Basic information of the included literature and the used database 
发 表 年 Bs SRQR 评 EX , aeu ”使 用 数据 的 年 。 su 
作者 分 (年 ) Vi 分 (分 ) (地 区 ) 数据 库 名 称 数据 库 类 型 份 跨度 (年 ) 涵盖 人 群 ( 数 ) 
ØDEGAARD 4%” 2022 IE 17 威 Norwegian Patient Registry 医院 患者 注 2008 一 2018 挪威 全 体 人 群 
登记 数据 
BRAMELD 等 2003 病 、 心 肌 梗 死 16 美国 Patient Registry 院 患 者 注 1980 一 1995 一 
登记 数据 
BEAUDET 4& 2014 痛 i7 S Régie de l'Assurance Maladie du ”医疗 保险 数据 2000—2007 ”魁北克 省 50% 以 上 人 
Qu é bec ( RAMQ) 
ASGHARI 4& 2009 尿 病 16 Ek RAMQ 医疗 保险 数据 1992—2002 5686255 
VANASSE A! 2012 精神 分 裂 证 16 S RAMQ 医疗 保险 数据 1996—2006 WHLIA 50% 以 上 人 
BENCHIMOL 5 ™ 2014 性 肠 道 疾病 16 Sk Canadian Institute for Health 。 ”医院 患者 注册 2002—2012 一 
Information's Discharge Abstract 登记 数据 
Database ( CIHI-DAD ) 
LIN pU 2014 膜 病 变 Uo PHAR Health Insurance Database of 。 ”医疗 保险 数据 2005—2011 台湾 省 99% 人 
Taiwan 
SULO £ [™] 2015 梗死 15 I Norway project 经 注册 的 居民 ”1994 一 2009 一 
健康 项 目 数据 
CZWIKLA 4 P! 207 F 前 列 腺 癌 、 16 德国 Statutory Health Insurance 医疗 保险 数据 2006—2014 德国 90% 人 口 
RASSEN 45 2019 性 肺 疾病 、 16 美国 electronic health records 经 注册 的 居民 2011—2014 美国 大 部 分 人 口 
病 、 精 神 分 裂 证 、 健康 项 目 数据 
病 
ABBAS 等 :4 2012 ”糖尿 病 、 结 直肠 癌 、 16 德国 Statutory Health Insurance 医疗 保险 数据 2000 一 2008 德国 90% 人 口 
心力 衰竭 
STEIN 等 中 2013 好 变性 17 美国 Clinformatics Data Mart database 医疗 保险 数据 — 2001—2011 245] 
ROSENLUND 4: 1# 2000 24 种 慢性 病 17 瑞典 National Patient Register 医院 患者 注册 。 ”2005 一 2013 7943 807 
登记 数据 
SCHMEDT 4& 1! 2017 多 发 性 硬化 17 德国 German Pharmaco epide miological ”经 注册 的 疾病 2004 一 2013 4175 877 
Research Database ( CePaRD ) 调查 项 目 数据 
CAMPLAIN 45 2017 OJER 18 美国 Atherosclerosis Risk in Communities ”经 注册 的 疾病 2000—2012 15744 
(ARIC) 调查 项 目 数据 
OHLMEIER 4 2019 SEWA 17 德国 Applied Health Research Berlin. ”经 注册 的 疾病 2010—2016 约 670 万 人 
( InGef ) Research Database 调查 项 目 数据 
K00 等 9 2014 糖尿病、 动脉 粥 样 硬化 17 韩国 National Health Insurance 医疗 保险 数据 。 2007 一 2011 韩国 97% 人 口 
( NHI ) Database 
JÜRISSON 45 2015 E 17 ”爱沙尼亚 Estonian Health Insurance Fund ”医疗 保险 数据 2005—2012 ”爱沙尼亚 9696 以 上 人 
BUKHBINDER 4 °" 2002 海 默 病 17 美国 Optum Clinformaties Data Mart 经 注册 的 疾病 2009 一 2019 一 
(CDM) 调查 项 目 数据 
ZHOU 4 7! 2022 栓 形 成 17 加 拿 大 CIHI-DAD 医院 患者 注 2011 一 2017 一 
登记 数据 
KATZENELLENBOGEN 等 — 2019 FE 心脏 病 17 ”澳大利亚 acute rheumatic fever register data ”医院 患者 注 2000 一 2017 一 
登记 数据 
0U 等 2 2012 尔 艾 海 默 。 18 美国 Medicare 5% claims data 医疗 保险 数据 1994 一 2007 484 542 
型 痴呆 
CLISSOLD 等 3] 2017 p 17 MEK Victorian Admitted Episodes 医院 患者 注 ] 1997 一 2008 4932422 
Dataset 登记 数据 
AHN 4& 0€ 2021 湿性 疾病 17 韩国 NHI Database 医疗 保险 数据 2007—2018 韩国 97% 人 口 
ANDERSON 45 2012 精神 分 裂 症 18 加 拿 大 RAMQ 医疗 保险 数据 2000 一 2006 WHETER 50% 以 上 人 
KATZENELLENBOGEN 等 .*! — 2010 心肌 梗死 20 ”澳大利亚 Hospital Morbidity Data Collection 医院 患者 注册 登 ”1980 一 2004 一 


202307.00678v1 


chinaXiv 


中 国 全 科 医 学 


当 kappa 值 为 >0.80~0.90 时 ， 可 认为 “一 致 性 好 ”; 当 
kappa 值 为 >0.90~1.00 时 ， 可 认为 “一 致 性 极 好 ”。 当 
kappa 值 为 >0.90~1.00 时 ， 所 选 洗 脱 期 时 长 下 的 发 病人 
数 与 基于 洗 脱 期 时 长 “ 金 标准 ”确定 的 发 病人 数 之 间 的 
一 致 性 极 好 ， 所 选 洗 脱 期 时 长 即 为 最 佳 洗 脱 期 时 长 。 
2.4.2” 道 向 生存 函数 法 “一 般 通 过 Kaplan-Meier 法 或 寿 
命 表 法 实现 估计 。 在 该 方法 中 ， 终 点 事件 为 患者 在 洗 脱 
期 内 被 记录 ， 生 存 被 定义 为 在 给 定 的 洗 脱 期 内 没有 捕捉 
到 该 患者 的 记录 ( 此 时 患者 可 被 认为 是 新 发 病例 ) o A 
体 来 说 ， 如 计算 j 年 某 慢性 病 i 的 发 病人 数 : a 代表 某 
患者 年 第 一 次 因 疾 病 i 被 记录 的 日 期 ,5b 代表 该 患者 
洗 脱 期 内 离 a 最 近 的 一 次 因 疾 病 i 被 记录 的 日 期 ,c 代 
表 洗 脱 期 的 开始 日 期 。 如 果 该 患者 在 给 定 的 洗 脱 期 内 被 
记录 ， 该 患者 的 生存 时 间 为 L-a-b; 如 果 该 患者 在 给 定 
的 洗 脱 期 内 没有 被 记录 ， 则 该 患者 被 定义 为 “ 删 失 ”,， 
即 “ 生 存 ”， 删 失 时 间 为 l=a-c。 据 此 建立 生存 函数 ， 
使 用 Kaplan-Meier 法 或 寿命 表 法 计算 在 给 定 洗 脱 期 了 
下 ， 研 究 对 象 的 生存 概率 【S$ (+) ] ， 并 绘制 生存 曲线 。 
同时 ，BRAMELD 4x '*! 和 BEAUDET 等 ' 在 研究 中 运 
用 风险 函数 [h(t) ] 计算 了 生存 时 间 已 达到 1 的 个 体 
在 接 下 来 的 At 时间 内 发 生 终点 事件 的 瞬时 风险 ， 并 绘 
制 了 风险 函数 曲线 。 研 究 认 为 ， 若 存在 某 一 时 点 女 使 得 
h GP 趋 近 于 零 、$ (Gi) 趋 近 于 定 值 ， 该 时 点 即 代表 最 
佳 洗 脱 期 时 长 。 在 实际 研究 中 ，BRAMELD 45 5 39, 
255 (1) «0.000 01 时 ， 即 可 认为 h Ct) 趋 近 于 0， 而 
BEAUDET 45 °! 则 未 给 出 具体 标准 。ASGHARI 等 
未 通过 风险 函数 计算 生存 时 间 已 达到 的 个 体 在 接 下 来 
的 A, 时 间 内 发 生 终点 事件 的 瞬时 风险 ， 其 认为 当 在 某 
一 时 点 下 人 研究 对 象 的 生存 概率 不 再 变动 ， 即 趋 于 稳定 
时 ， 该 时 点 即 代表 最 佳 洗 脱 期 时 长 。 
2.5 洗 脱 期 时 长 ”纳入 文献 所 设 定 的 洗 脱 期 时 长 为 
0.5-15.0 年 。 当 不 同文 献 聚焦 的 疾病 不 同时 ， 设 定 的 洗 
脱 期 时 长 之 间 有 明显 差异 ; 但 当 不 同文 献 聚焦 的 疾病 相 
同时 , 设 定 的 洗 脱 期 时 长 之 间 的 差异 也 较 大 , 如 5 篇“* 
10. 23 2 聚焦 糖尿 病 的 文献 所 设 定 的 洗 脱 期 时 长 ， 最 长 
为 13 年 ， 最 短 为 1 年 。 纳 入 文献 洗 脱 期 时 长 确定 方法 
及 设 定 的 洗 脱 期 时 长 见 表 2。 
3 讨论 

本 次 研究 系统 梳理 了 使 用 行政 管理 数据 识别 慢性 病 
发 病 病例 时 确定 最 佳 洗 脱 期 时 长 的 方法 。 目 前 ， 半 数 左 
右 【48.1% (26/54) ] 基于 行政 管理 数据 评估 慢性 病 患 
病 / 发 病情 况 等 流行 病 学 特征 的 文献 在 识别 慢性 病 发 病 
病例 时 ， 设 定 了 洗 脱 期 ， 但 对 于 洗 脱 期 的 时 长 目前 尚 没 
有 统一 结论 。 纳 入 的 26 篇 文献 所 设 定 的 洗 脱 期 时 长 为 
0.5~15.0 年 。 确 定 洗 脱 期 时 长 的 方法 主要 包括 直接 限定 
法 、 一 致 性 检验 法 、 首 向 生存 函数 法 3 种 ， 其 中 最 常用 
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的 方法 是 直接 限定 法 ， 逆 向 生存 曲线 法 的 使 用 率 相对 较 
低 。 

本 次 研究 发 现 ， 半 数 以 上 [57.7% (15/26) ] 被 纳 
入 文献 基于 直接 限定 法 给 定 洗 脱 期 时 长 ， 在 该 方法 下 ， 
研究 者 根据 专家 建议 、 文 献 回 顾 结 果 等 直接 限定 洗 脱 
期 时 长 。 直 接 限 定 法 虽 具 有 便捷 、 易 于 操作 的 特点 ， 
但 因 缺 乏 量化 的 数据 支持 ,一 定 程度 上 使 限定 的 洗 脱 期 
时 长 不 具有 说 服 力 。 部 分 研究 者 也 在 研究 局 限 性 部 分 
出， 直接 限定 洗 脱 期 时 长 可 能 会 导致 发 病 率 估计 结 
果 不 准确 ”| ; 2 篇 "| 文献 选择 直接 以 ( 可 获得 
数据 的 最 大 年 份 - 可 获得 数据 的 最 小 年 份 ) 为 洗 脱 期 
时 长 ， 但 此 方法 下 研究 者 只 能 探讨 可 获得 数据 最 大 年 
份 慢 性 病 的 发 病情 况 ， 数 据 无 法 得 到 有 效 利 用 。 部 分 文 
献 [38.5% ( 10/26 ) ] 基于 一 致 性 检验 的 相关 指标 确定 
THp BUS P 0 971 57 ， 但 不 同 的 文献 所 采用 
的 一 致 性 检验 指标 不 同 ， 目 前 被 使 用 较 多 的 一 致 性 检验 
指标 为 Kappa 值 和 过 高 估计 率 ， 其 中 Kappa 值 的 判定 
标准 为 BYRT 等 '” 1993 年 提出 的 标准 。 多 数 研究 者 选 
择 Kappa 值 >0.80 (“一 致 性 好 ”/“ 一 致 性 极 好 ”) 作 
为 确定 洗 脱 期 时 长 的 标准 "但 有 研究 认为 在 识别 
高 患 病 率 疾病 ( 如 糖尿 病 、 心 血管 疾病 ) 发 病 病例 时 ， 
高 Kappa 值 可 能 与 疾病 患 病人 数 多 有 关 ，Kappa 值 的 稳 
定性 有 待 进一步 探究 "1 。 目 前 ， 尚 缺乏 基于 除 Kappa 
值 外 的 其 他 一 致 性 评价 指标 的 洗 脱 期 时 长 确定 标准 ， 如 
ABBAS 等 "1 以 过 高 估计 率 10% 作为 临界 标准 ， 而 在 
ROSENLUND'“ 等 的 研究 中 这 一 指标 被 设 定 为 2096; 
对 于 阳性 预测 值 ， 有 研究 者 选择 80% TE PLC; 
BENCHIMOL 等 22 则 选择 准确 度 达 到 90% 作为 评判 标 
准 。 仅 有 少 部 分 研究 (11.5% (3/26) ] 使 用 逆向 后 存 
函数 法 确定 最 佳 洗 脱 期 时 长 7^. YE BRAMELD 等 
于 2003 首次 提出 采用 逆向 生存 函数 法 确定 洗 脱 期 时 长 
后 ,该 方法 被 陆续 使 用 “”"”  。 道 向 生存 函数 法 强调 通 
过 绘制 生存 曲线 和 风险 函数 曲线 ， 并 依据 生存 概率 和 风 
仿 概 率 确 定 最 佳 洗 脱 期 时 长 。 研 究 者 认为 该 方法 可 以 使 
数据 得 到 最 大 限度 的 利用 ， 并 能 够 确保 研究 者 充分 使 用 
所 有 可 获得 的 记录 佑 计生 存 函 数 。 同 时 ， 通 过 生存 曲线 
和 风险 函数 曲线 可 以 直观 观察 到 生存 概率 和 风险 概率 的 
集中 趋势 ， 有 效 、 定 量 地 判断 最 佳 的 洗 脱 期 时 长 。 但 该 
方法 也 存在 一 定 的 局 限 性 ， 即 判断 标准 尚未 得 到 完全 统 
一 ,如 BRAMELD 等 * 认 为 ,车 存 在 某 一 时 点 tf 使 得 h( 1f) 
«0.000 01, 该 时 点 即 代表 最 佳 洗 脱 期 时 长 , 按照 此 标准 ， 
其 研究 ( 聚焦 糖尿 病 ) 中 洗 脱 期 长 达 13 年 。ASGHARI 
4x 77 (其 研究 亦 聚 焦 糖 尿 病 ) 并 未 使 用 这 一 标准 ， 其 
根据 研究 对 象 的 生存 概率 趋 于 稳定 这 一 标准 ， 确 认 洗 脱 
期 时 长 为 5 年。 值得 注意 的 是 ， 由 于 对 洗 脱 期 时 长 的 确 
定 方法 、 判 断 标准 尚未 达成 共识 ， 许 多 研究 者 在 探究 最 
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表 2 纳入 文献 洗 脱 期 时 长 确定 方法 及 设 定 的 洗 脱 期 时 长 


Table 2 Methods for determining the optimal washout period duration and the set duration of it included in the literature 


作者 设 定 的 洗 脱 期 洗 脱 期 时 长 确定 方法 

时 长 (年 ) 直接 限定 法 一 致 性 检验 法 逆向 生存 函数 法 
ABBAS 等 !51 1.0-8.0 V (过 高 估计 率 ) 
STEIN 等 :51 3.0-5.0 V (过 高 估计 率 ) 
ROSENLUND 4& ^ 0.5-9.0 V (过 高 估计 率 ) 
SCHMEDT 等 5 8.0 V (过 高 估计 率 ) 
CAMPLAIN $ 0.5~3 MV( 过 高 估计 率 ) 
ØDEGAARD 等 '” 1.0~8.0 V (过 高 估计 率 ) 

VANASSE 等 1 7.0 V (Kappa 值 、 阳 性 预测 值 ) 

BENCHIMOL 等 ' ”| 4.0 V 灵敏度、 准确 度 . 阳 性 预测 值 、 阴 性 预测 值 ) 
BEAUDET 4 '*! 70 V( 阳性 预测 值 、Kappa 值 ) v 
ASGHARI 4& 0 5.0 V C Kappa fË ) v 
BRAMELD 等 13.0 V 

LIN 4 (9! 3.0 V (基于 文献 回顾 ) 

OHLMEIER 4& 4.0 V (基于 文献 回顾 ) 

KOO 等 1 2.0 V (基于 文献 回顾 ) 
JÜRISSON 等 i” 1.0 v 
BUKHBINDER 4 l?" 6.0 V 
ZHOU $% 1.0 v 
KATZENELLENBOGEN 4?! 13.5 V 因 受 限制 于 数据 ) 
OU & € 3.0 V (基于 文献 回顾 ) 
CLISSOLD 等 5! 5.0 V (基于 文献 回顾 ) 
AHN 4 Ue 3.0 v 
ANDERSON 4 4.06.0 v 
KATZENELLENBOGEN 4 *! 15.0 V 因 受 限制 于 数据 ) 
SULO $ 3.0, 5.0, 7.0, 8.0, 10.0 v 
CZWIKLA 4& °) 1.07.0 V 因 受 限制 于 数据 ) 
RASSEN 4 57 1.0-4.0 V 因 受 限制 于 数据 ) 


佳 洗 脱 期 时 长 时 ， 选 择 计算 多 个 一 致 性 指标 的 数值 ， 并 
结合 基于 逆向 生存 函数 法 得 出 的 结果 进行 综合 判断 
10] 

研究 纳入 的 文献 所 设 定 的 洗 脱 期 时 长 为 0.5~15.0 
年 ， 聚 焦 不 同 疾病 的 研究 设 定 的 洗 脱 期 时 长 之 间 的 差异 
较 大 。 有 研究 者 认为 ,不同 疾病 的 发 展 轨迹 和 特征 不 同 
是 导致 该 现象 的 出 现 重要 原因 “' 。 本 研究 同时 发 现 ， 
不 同 研究 即使 聚焦 同一 疾病 ， 如 糖尿 病 ， 所 设 定 的 洗 脱 
期 时 长 之 间 的 差异 也 较 大 ， 其 原因 可 能 是 不 同 研 究 所 使 
用 数据 的 收集 方式 不 同 且 来 源 人 和 群 的 就 医 习惯 存在 较 大 
差异 。 因 此 ， 在 使 用 不 同类 型 的 数据 识别 不 同 疾病 的 发 
病 病 例 时 ， 均 应 选择 合适 的 方法 探索 最 佳 洗 脱 期 时 长 ， 
在 此 基础 上 针对 疾病 流行 病 学 特征 进行 进一步 的 研究 ， 
这 与 部 分 研究 者 的 观点 相 一 致 ' 一 “' 。 研 究 者 后 续 在 
使 用 中 国医 疗 保险 数据 、 疾 病 登 记 注 册 数 据 等 行政 管理 
数据 进行 慢性 病 的 流行 病 特征 相关 分 析 时 ， 应 考虑 到 不 
同 国家 ( 地 区 ) 在 医疗 保险 政策 、 环 境 、 人 种 等 方面 存 
在 明显 差异 ， 不 应 直接 应 用 其 他 国家 研究 者 得 出 的 洗 脱 


y 


期 时 长 ， 应 在 数据 的 支持 下 ， 选 择 合适 的 方法 确定 最 住 
洗 脱 期 时 长 ， 并 在 此 基础 上 进行 后 续 的 分 析 研 究 。 
行政 管理 数据 作为 宝贵 的 资源 ， 涵 盖 范 围 广 、 年 份 
跨度 大 、 可 被 便捷 地 获取 ， 相 较 于 传统 的 调查 数据 有 一 
定 的 优势 。 自 2012 年 改革 医疗 保险 制度 以 来 ， 中 国 大 
力 推广 医疗 保险 政策 ， 扩 大 参 保 人 群 覆盖 范围 1， 
随 着 改革 的 逐步 深入 ， 有 效 数 据 的 积累 量 持续 增加 。 但 
目前 在 万 方 知识 服务 平台 、 中 国 知 网 、 维 普 中 文科 技 期 
刊 全 文 数据 库 检 索 到 的 利用 医保 数据 、 医 院 患者 注册 登 
记 数 据 等 行政 管理 数据 对 慢性 病 流行 病 学 特征 进行 分 析 
的 研究 较 少 ( 截至 2022-10-01, 仅 21 篇 ) ， 我 国 相关 
人 研究 数量 远 少 于 行政 管理 数据 完备 、 人 研究 范式 成 熟 的 其 
他 国家 (地 区 ) ， 说 明 中 国 在 此 方面 仍 处 于 探索 阶段 ， 
未 来 发 展 潜力 巨大 。 同 时 ， 中 国内 地 研究 者 在 使 用 医疗 
保险 数据 等 行政 管理 数据 进行 分 析 时 ,未 重视 洗 脱 期 (在 
万 方 知识 服务 平台 、 中 国 知 网 、 维 普 中 文科 技 期 刊 全 文 
数据 库 检 索 到 的 基于 行政 管理 数据 评估 慢性 病 患 病 /发 
病情 况 等 流行 病 学 特征 的 文献 均 未 涉及 洗 脱 期 ) ， 此 外 
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也 未 有 内 地 研究 者 探讨 利用 中 国人 群 医疗 保险 数据 等 行 
政 管理 数据 对 疾病 流行 病 学 特征 进行 分 析 时 如 何 确定 洗 
脱 期 时 长 。 因 此 ， 本 研究 系统 总 结 的 3 种 可 用 于 确定 洗 
脱 期 时 长 的 方法 ， 可 为 后 续 研 究 者 基于 中 国医 疗 保险 数 
据 等 行政 管理 数据 准确 识别 慢性 病 新 发 病例 、 探 究 疾病 
流行 病 学 特征 提供 相关 思路 和 方法 支持 。 

本 研究 存在 一 定 的 局 限 性 。 首 先 ， 由 于 行政 管理 数 
具有 特殊 性 ， 部 分 数据 可 能 为 内 部 数据 、 机 密 数据 ， 
在 检索 文献 的 过 程 中 ， 一 些 未 公开 发 表 的 文献 无 法 被 检 
索 到 ， 故 未 将 其 纳 和 人 研究 范畴 ， 这 可 能 会 对 研究 结果 产 
生 一 定 的 影响 。 其 次 ， 研 究 者 仅 对 中 、 英 文 数据 库 中 的 
相关 文献 进行 了 检索 ， 未 检索 以 其 他 语种 发 表 的 相关 文 
献 ， 可 能 会 导致 检索 到 的 方法 全 面 性 不 足 。 

作者 贡献 : 杨 文 怡 提出 研究 选 题 方向 ， 负 责 文 献 检 
索 收集 和 整理 ， 并 撰写 论文 初稿 ; 王 癌 侈 进行 文献 数据 
提取 和 提取 信息 整理 ; 艾 丽 梅 负责 论文 的 修订 ; 万 霞 负 
责 文 章 的 质量 控制 及 审 校 ， 对 文章 整体 负责 ; 所 有 作者 
确认 了 论文 的 最 终 稿 。 
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